1
Học Máy Cổ Điển
PolyU COMP5511Bài giảng 6
00:00

Học Máy Cổ Điển

Chào mừng bạn đến với Bài học 6 về Khái niệm Trí tuệ Nhân tạo (COMP5511). Buổi học này đóng vai trò là cầu nối từ nền tảng lý thuyết đến các triển khai thuật toán thực tế. Mặc dù AI hiện đại thường nhấn mạnh vào Học sâu (Deep Learning), Học Máy Cổ Điển vẫn là nền tảng của phân tích dữ liệu. Các thuật toán này mang lại khả năng diễn giải caohiệu quả tính toán, làm cho chúng trở thành lựa chọn ưa thích cho dữ liệu có cấu trúc và phân tích tiêu chuẩn công nghiệp.

1. Học có Giám sát

Mô hình này liên quan đến việc huấn luyện một mô hình trên tập dữ liệu có nhãn, nơi thuật toán học mối quan hệ giữa các đặc trưng đầu vào và một đầu ra mục tiêu cụ thể. Điều này cho phép mô hình dự đoán kết quả cho dữ liệu mới, chưa từng thấy một cách chính xác.

  • Cây Quyết định: Các mô hình phân chia dữ liệu thành các nhánh để đưa ra quyết định phân loại hoặc số.
  • Máy Vector Hỗ trợ (SVM): Các thuật toán tìm siêu phẳng tối ưu để tối đa hóa khoảng cách giữa các lớp dữ liệu khác nhau.

2. Học không Giám sát

Các thuật toán này phân tích dữ liệu không có nhãn để khám phá các mẫu, cấu trúc hoặc nhóm ẩn mà không cần bất kỳ hướng dẫn nào về đầu ra. Các kỹ thuật chính bao gồm:

  • Phân cụm K-trung bình: Nhóm các điểm dữ liệu thành K nhóm riêng biệt dựa trên sự tương đồng về đặc trưng.
  • Phân tích Thành phần Chính (PCA): Một kỹ thuật giảm chiều dữ liệu được sử dụng để đơn giản hóa dữ liệu phức tạp mà vẫn giữ được phương sai thiết yếu của nó.
Khả năng diễn giải so với Độ phức tạp
Một lợi thế đáng kể của học máy cổ điển là tính minh bạch. Không giống như các mô hình học sâu "hộp đen", các thuật toán như Cây quyết định cho phép con người truy vết logic chính xác đằng sau một dự đoán, điều này rất quan trọng đối với các lĩnh vực có rủi ro cao như y tế hoặc tài chính.
Quy trình triển khai Scikit-learn